یافتن مرکز بهینه برای خوشه ها در الگوریتم k-means

thesis

وزارت علوم، تحقیقات و فناوری - دانشگاه شیخ بهایی - دانشکده مهندسی کامپیوتر
author مهدی صادقیان
adviser احمد براانی
Number of pages: First 15 pages
publication year 1392

abstract

چکیده داده کاوی به فرایند استخراج الگوهای پنهان و یا ویژگی های جالب و مفید از مجموعه داده ها گفته می شود که با استفاده از آن می توان به تصمیم گیری و پیش بینی رفتار آینده پرداخت. خوشه بندی در داده کاوی یکی از عملیات مهم در نتیجه گیری داده-کاوی بر روی داده ها به حساب می آید. خوشه بندی افراز بندی یک گروه متنوع به تعدادی زیر گروه مشابه یا گروه بندی مجموعه-ای از اشیاء به کلاسی از اشیاء مشابه می باشد، در هر خوشه باید داده هایی شبیه به هم قرار گیرند و کمترین شباهت را با داده-های موجود در دیگر خوشه ها دارا باشند. الگوریتم k-means یکی از روش های خوشه بندی است. در این الگوریتم ابتدا باید یک نقطه ی مرکزی برای هر خوشه انتخاب شود. یعنی در مرحله نخست باید k داده انتخاب شود که هر کدام معرف مرکز ابتدایی یک خوشه می باشند. سپس هر کدام از داده های باقیمانده در خوشه ای قرار داده می شود که بیشترین شباهت را به اعضائ آن داشته باشد. در ادامه، برای هر خوشه ی ایجاد شده بوسیله میانگین گیری از داده های آن خوشه، مرکز جدیدی بدست آورده و موقعیت هر داده برای خوشه های جدید محاسبه می گردد. این مرحله تا رسیدن به خوشه های قابل قبول ادامه می یابد. با مشخص کردن داده های مناسب برای مرکزهای اولیه خوشه ها می توان سرعت رسیدن به جواب نهایی را افزایش داد. برای یافتن مرکزهای اولیه بهینه بهتر است داده هایی انتخاب شوند که دارای تعداد همسایگی زیادی باشند. در روش پیشنهادی این پژوهش، برای یافتن داده های مناسب برای مراکز از بخش بندی (تقسیم) مجموعه داده ها استفاده شده است. در این روش مجموعه داده ها به تعداد خوشه مورد نیاز بخش بندی می شود. سپس میانگین هر کدام از این بخش های جدید به عنوان مراکز اولیه خوشه ها استفاده می شود. روش پیشنهادی باعث افزایش سرعت و دقت الگوریتم k-means می گردد. کلیدواژه ها: داده کاوی - خوشه بندی - مرکز خوشه ها – الگوریتم k-means

Already have an account?login

similar resources

بهبود الگوریتم خوشه بندی مشتریان برای توزیع قطعات یدکی با رویکرد داده کاوی (k-means)

Customer classification using k-means algorithm for optimizing the transportation plans is one of the most interesting subjects in the Customer Relationship Management context. In this paper, the real-world data and information for a spare-parts distribution company (ISACO) during the past 36 months has been investigated and these figures have been evaluated using k-means tool developed for spa...

full text

اصلاح خوشه بندی k-means توسط الگوریتم ژنتیک بهبودیافته

خوشه بندی تکنیکی از داده¬کاوی است که تعدادی آیتم را می¬گیرد و آنها را براساس ویژگیها¬یشان درون خوشه¬ها قرار می¬دهد. آیتمهای درون هر خوشه بیشترین میزان شباهت را در ویژگی بخصوصی که از پیش مشخص شده است،با هم دارند و آیتمهای خوشه¬های مختلف بیشترین تفاوت را در آن ویژگی، نسبت به هم دارند. خوشه¬بندی انواع مختلفی دارد که k-means یکی از بهترین و ساده¬ترین آنهاست. این خوشه¬بندی به این دلیل که پایه¬ی برخی...

بهبود الگوریتم خوشه بندی مشتریان برای توزیع قطعات یدکی با رویکرد داده کاوی (k-means)

خوشه بندی مشتریان با رویکرد داده کاوی برای بهینه سازی برنامه حمل ونقل یکی از مباحث مطرح در حوزه مدیریت ارتباط با مشتریان است. در این مقاله داده ها و اطلاعات واقعی توزیع قطعات یدکی شرکت ایساکو در طی 36 ماه گذسته مورد بررسی قرارگرفته است و به کمک ابزار داده کاوی شباهت رفتار تقاضای قطعات یدکی توسط مشتریان درمناطق مختلف کشور ایران سنجیده شده است. تابع سنجش شباهت رفتار مشتریان در مناطق مختلف براس...

full text

خوشه بندی تصاویر پوشاک با استفاده از پردازش تصویر و الگوریتم K-means

امروزه صنعت پوشاک و مد صنعتی جهانی است و اکثر کشورها روی این صنعت سرمایه گذاری می کنند. در سالهای اخیر با گسترش تجارت الکترونیک و با توجه به مزیت های آن مثل قابل استفاده بودن کالاها با هزینه کمتر، انتخاب گسترده تر و صرفه جویی در زمان، انبوه مردم مایحتاج خود را از وبگاه ها و فروشگاه های اینترنتی به جای مغازه ها تهیه می کنند. این موضوع، نیاز به سامانه ای را ایجاد کرده که بتواند پوشاک را شناسایی و...

full text

بهینه سازی سبدسهام با استفاده از روش k-means و الگوریتم ژنتیک

دیدگاهی که در این مقاله ارائه می دهیم در دو مرحله جای می گیرد: مرحله ی اول طبقه بندی سهم ها ی پورتفوی ابتدایی با روش k-means به دسته های کوچکتر است، سپس طبقه ای که کمترین ریسک و بیشترین بازده را دارد یا به عبارتی طبقه ای که بهینه تر می باشد را به عنوان ورودی الگوریتم خود که آن را MinVaRMaxR نامیده ایم برمی گزینیم. الگوریتم مذبور،الگوریتم پویایی، براساس الگوریتم ژنتیک و مفهوم ارزش در معرض خطر م...

full text

بررسی و مقایسه الگوریتم فازی ‏‎(c-means)‎‏ و تحلیل خوشه ای ‏‎(k-means)‎‏ در بیمار عفونت ادراری

چون در اکثر رویدادها علم پزشکی بصورت غیرقطبی و مبهم با علائم فیزیولوژیکی بیان می شوند و این نوع مطالعات عموما مبهم و نادقیق هستند. در نتیجه برای بررسی این مفاهیم براساس نظریه های تئوریهای فازی و الگوریتم های آن که مهمترین آنها خوشه بندی فازی است استفاده می شود و از ویژگیهای مهم الگوریتم خوشه بندی فازی آنست که در ساختار الگوریتم فازی در خوشه بندی از تابع عضویت فازی استفاده می شود و یک فرد ممکن ا...

15 صفحه اول

My Resources

Save resource for easier access later

Save to my library Already added to my library

{@ msg_add @}

document type: thesis

وزارت علوم، تحقیقات و فناوری - دانشگاه شیخ بهایی - دانشکده مهندسی کامپیوتر

Keywords

داده کاوی خوشه بندی مرکز خوشه

Hosted on Doprax cloud platform doprax.com